Kho ngữ liệu là gì? Các công bố khoa học về Kho ngữ liệu

Kho ngữ liệu (hay còn gọi là kho dữ liệu) là một nơi lưu trữ và quản lý các tập dữ liệu lớn, được sắp xếp và tổ chức để cung cấp cho người dùng truy cập và tìm ...

Kho ngữ liệu (hay còn gọi là kho dữ liệu) là một nơi lưu trữ và quản lý các tập dữ liệu lớn, được sắp xếp và tổ chức để cung cấp cho người dùng truy cập và tìm kiếm thông tin. Kho ngữ liệu có thể bao gồm các tập dữ liệu từ nhiều nguồn khác nhau, chẳng hạn như dữ liệu khoa học, dữ liệu thương mại, dữ liệu xã hội, dữ liệu văn bản, dữ liệu hình ảnh và dữ liệu âm thanh. Kho ngữ liệu thường được sử dụng trong các lĩnh vực như khoa học dữ liệu, học máy, trí tuệ nhân tạo, khai phá dữ liệu và nghiên cứu khoa học.
Kho ngữ liệu là một hệ thống cung cấp nền tảng để lưu trữ, tổ chức và quản lý các tập dữ liệu lớn. Kho ngữ liệu giúp các tổ chức và cá nhân có thể lưu trữ, truy cập, tìm kiếm, và chia sẻ dữ liệu một cách hiệu quả.

Các kho ngữ liệu thường có các tính năng sau:

1. Lưu trữ dữ liệu: Kho ngữ liệu có khả năng lưu trữ các tập dữ liệu lớn được thu thập từ nhiều nguồn khác nhau. Dữ liệu này có thể bao gồm dữ liệu từ các loại file đa phương tiện, database, file văn bản, file hình ảnh, file âm thanh, file video, v.v. Kho ngữ liệu cung cấp không gian lưu trữ đủ lớn để đáp ứng nhu cầu lưu trữ của người dùng.

2. Tổ chức dữ liệu: Kho ngữ liệu giúp tổ chức dữ liệu một cách cấu trúc và có tổ chức. Các tập dữ liệu trong kho được phân loại, đánh dấu và gắn nhãn để có thể truy cập và tìm kiếm dễ dàng. Việc tổ chức dữ liệu giúp người dùng dễ dàng tìm kiếm và truy cập đến các tập dữ liệu một cách nhanh chóng.

3. Quản lý dữ liệu: Kho ngữ liệu cung cấp các công cụ và tính năng để quản lý dữ liệu một cách hiệu quả. Chúng bao gồm việc tạo, chỉnh sửa, xóa và sao lưu dữ liệu. Kho ngữ liệu cũng cho phép xác thực và phân quyền truy cập dữ liệu, đảm bảo rằng chỉ những người được ủy quyền có thể truy cập hoặc chỉnh sửa dữ liệu.

4. Truy cập và tìm kiếm dữ liệu: Kho ngữ liệu cung cấp các công cụ và giao diện để người dùng có thể truy cập và tìm kiếm dữ liệu một cách dễ dàng. Người dùng có thể sử dụng các công cụ tìm kiếm và bộ lọc để tìm kiếm dữ liệu theo các tiêu chí nhất định, chẳng hạn như từ khóa, ngày tạo, loại tập tin, v.v. Kho ngữ liệu cũng hỗ trợ việc tìm kiếm dữ liệu sử dụng các chỉ mục và thuật toán tối ưu, giúp tăng tốc độ truy cập và tìm kiếm dữ liệu.

5. Chia sẻ dữ liệu: Kho ngữ liệu cung cấp khả năng chia sẻ dữ liệu với người dùng khác, giúp tăng cường sự hợp tác và trao đổi thông tin. Người dùng có thể chia sẻ tập dữ liệu cho người khác theo các quyền truy cập khác nhau, cho phép người khác chỉ được xem, chỉnh sửa hoặc phân phối bản sao của dữ liệu.

Các kho ngữ liệu phổ biến bao gồm Amazon S3, Google Cloud Storage, Microsoft Azure Storage và Open Data Initiative. Các kho ngữ liệu là một thành phần quan trọng trong việc xây dựng các ứng dụng dựa trên dữ liệu, phân tích dữ liệu và làm việc với dữ liệu lớn.

Danh sách công bố khoa học về chủ đề "kho ngữ liệu":

Triacylglycerols từ vi tảo như là nguồn nguyên liệu sản xuất nhiên liệu sinh học: góc nhìn và tiến bộ
Plant Journal - Tập 54 Số 4 - Trang 621-639 - 2008
Tóm tắt

Vi tảo đại diện cho một nhóm vi sinh vật vô cùng đa dạng nhưng có khả năng chuyên môn hóa cao để thích nghi với các môi trường sinh thái khác nhau. Nhiều loài vi tảo có khả năng sản xuất một lượng đáng kể (ví dụ: 20–50% trọng lượng khô tế bào) triacylglycerols (TAG) như một loại lipid dự trữ dưới căng thẳng quang hóa hay các điều kiện môi trường bất lợi khác. Axit béo, thành phần cấu thành của TAGs và tất cả các lipid tế bào khác, được tổng hợp trong lục lạp bằng một tập hợp duy nhất của enzyme, trong đó acetyl CoA carboxylase (ACCase) là yếu tố chính điều chỉnh tỷ lệ tổng hợp axit béo. Tuy nhiên, sự biểu hiện của các gene liên quan đến quá trình tổng hợp axit béo vẫn chưa được hiểu rõ ở vi tảo. Sự tổng hợp và phân tách TAG vào các thể lipid bào tương dường như là cơ chế bảo vệ mà các tế bào tảo sử dụng để ứng phó với các điều kiện căng thẳng, nhưng ít được biết về việc điều chỉnh sự hình thành TAG ở mức độ phân tử và tế bào. Trong khi khái niệm sử dụng vi tảo như một nguồn nguyên liệu sinh khối giàu lipid thay thế và tái tạo cho nhiên liệu sinh học đã được khám phá trong vài thập kỷ qua, hệ thống có thể mở rộng và khả thi về kinh tế vẫn chưa hình thành. Hiện nay, việc sản xuất dầu tảo chủ yếu giới hạn ở các loại dầu chất lượng cao có giá trị dinh dưỡng hơn là các loại dầu hàng hóa cho nhiên liệu sinh học. Bài đánh giá này cung cấp tóm tắt ngắn gọn về kiến thức hiện tại của vi tảo giàu dầu và quá trình tổng hợp axit béo và TAG của chúng, các hệ thống mô hình tảo và cách tiếp cận gen để hiểu rõ hơn việc sản xuất TAG, cũng như cái nhìn lịch sử và hướng đi cho nghiên cứu và thương mại hóa nhiên liệu sinh học dựa trên vi tảo.

#Vi tảo #triacylglycerols #axit béo #tổng hợp lipid #nhiên liệu sinh học #căng thẳng quang hóa #ACCase #lipid bào tương #sinh khối #đổi mới bền vững.
Phân Tích Cập Nhật của KEYNOTE-024: Pembrolizumab So với Hóa Trị Liệu Dựa trên Bạch Kim cho Ung Thư Phổi Không Tế Bào Nhỏ Tiến Triển với Điểm Tỷ Lệ Khối U PD-L1 từ 50% trở lên
American Society of Clinical Oncology (ASCO) - Tập 37 Số 7 - Trang 537-546 - 2019
Mục đích

Trong nghiên cứu KEYNOTE-024 giai đoạn III ngẫu nhiên, nhãn mở, pembrolizumab đã cải thiện đáng kể thời gian sống không tiến triển bệnh và tổng thời gian sống so với hóa trị liệu dựa trên bạch kim ở bệnh nhân ung thư phổi không tế bào nhỏ (NSCLC) tiến triển chưa được điều trị trước đó, có tỷ lệ phần trăm khối u thể hiện PD-L1 từ 50% trở lên và không có các biến đổi EGFR/ALK. Chúng tôi báo cáo một phân tích cập nhật về tổng thời gian sống và khả năng dung nạp, bao gồm các phân tích điều chỉnh cho thiên lệch tiềm năng do chuyển đổi từ hóa trị liệu sang pembrolizumab.

Bệnh nhân và Phương pháp

Bệnh nhân được phân ngẫu nhiên vào pembrolizumab 200 mg mỗi 3 tuần (tối đa 2 năm) hoặc lựa chọn của điều tra viên về hóa trị liệu dựa trên bạch kim (bốn đến sáu chu kỳ). Bệnh nhân được phân vào nhóm hóa trị liệu có thể chuyển sang pembrolizumab khi đáp ứng tiêu chuẩn. Điểm cuối chính là thời gian sống không tiến triển; tổng thời gian sống là một điểm cuối thứ cấp quan trọng. Phân tích điều chỉnh chuyển đổi được thực hiện bằng ba phương pháp: phương pháp hai giai đoạn đơn giản, thời gian thất bại cấu trúc bảo toàn hạng và trọng số xác suất nghịch đảo.

Kết quả

Ba trăm lẻ năm bệnh nhân đã được phân ngẫu nhiên (pembrolizumab, n = 154; hóa trị liệu, n = 151). Tại thời điểm cắt dữ liệu (ngày 10 tháng 7 năm 2017; theo dõi trung bình, 25,2 tháng), 73 bệnh nhân trong nhóm pembrolizumab và 96 trong nhóm hóa trị liệu đã tử vong. Tổng thời gian sống trung bình là 30,0 tháng (CI 95%, 18,3 tháng chưa đạt) với pembrolizumab và 14,2 tháng (CI 95%, 9,8 đến 19,0 tháng) với hóa trị liệu (tỉ số nguy cơ, 0,63; CI 95%, 0,47 đến 0,86). Tám mươi hai bệnh nhân được phân vào nhóm hóa trị liệu đã chuyển giao trong nghiên cứu sang nhận pembrolizumab. Khi điều chỉnh cho chuyển đổi sử dụng phương pháp hai giai đoạn, tỉ số nguy cơ cho tổng thời gian sống của pembrolizumab so với hóa trị liệu là 0,49 (CI 95%, 0,34 đến 0,69); kết quả sử dụng thời gian thất bại cấu trúc bảo toàn hạng và trọng số xác suất nghịch đảo là tương tự. Các sự cố bất lợi độ 3 đến 5 liên quan đến điều trị ít phổ biến hơn với pembrolizumab so với hóa trị liệu (31,2% so 53,3%, tương ứng).

Kết luận

Với thời gian theo dõi kéo dài, liệu pháp pembrolizumab liệu pháp đơn tia đầu tiên tiếp tục chứng minh lợi ích tổng thời gian sống hơn so với hóa trị liệu ở bệnh nhân NSCLC tiến triển, chưa được điều trị trước đó và không có các biến đổi EGFR/ALK, mặc dù có sự chuyển đổi từ nhóm kiểm soát sang pembrolizumab như phương pháp điều trị tiếp theo.

#Ung thư phổi không tế bào nhỏ #NSCLC #pembrolizumab #hóa trị liệu dựa trên bạch kim #khối u thể hiện PD-L1 #EGFR/ALK #tổng thời gian sống #thời gian sống không tiến triển #chuyển đổi điều trị #tỉ số nguy cơ #sự cố bất lợi độ 3 đến 5 #liệu pháp đơn tia đầu tiên
Dân số của người đồng tính nam và đồng tính nữ tại Hoa Kỳ: Bằng chứng từ các nguồn dữ liệu hệ thống có sẵn
Duke University Press - Tập 37 Số 2 - Trang 139-154 - 2000
Tóm Tắt

Công trình này cung cấp tổng quan về các nguồn dữ liệu khoa học xã hội tiêu chuẩn hiện có cho phép nghiên cứu có hệ thống về cộng đồng người đồng tính nam và đồng tính nữ tại Hoa Kỳ. Đối với mỗi nguồn dữ liệu, chúng tôi xem xét cách thức xác định xu hướng tình dục, và ghi nhận kích thước mẫu tiềm năng. Chúng tôi đặc biệt chú ý đến vấn đề quan trọng về sai số đo lường, đặc biệt là mức độ mà các cá nhân được ghi nhận là đồng tính nam và đồng tính nữ thực sự được ghi nhận chính xác. Mối quan tâm của chúng tôi là vì người đồng tính nam và đồng tính nữ chiếm một tỉ lệ nhỏ trong dân số, nên các vấn đề đo lường nhỏ có thể dẫn đến những sai lầm nghiêm trọng trong suy luận. Khi xem xét người đồng tính nam và đồng tính nữ trong nhiều bộ dữ liệu, chúng tôi cũng đạt được mục tiêu thứ hai: Chúng tôi cung cấp một bộ các thống kê về cộng đồng này có liên quan đến một số cuộc tranh luận chính sách hiện nay.

#thống kê #dân số học #xu hướng tình dục #đo lường sai số #dữ liệu khoa học
Kết quả dài hạn từ nghiên cứu COMFORT-II, thử nghiệm giai đoạn 3 của ruxolitinib so với liệu pháp tốt nhất có sẵn cho bệnh xơ tủy
Leukemia - Tập 30 Số 8 - Trang 1701-1707 - 2016
Tóm tắt

Ruxolitinib là một chất ức chế Janus kinase (JAK) (JAK1/JAK2) đã cho thấy sự vượt trội hơn so với giả dược và liệu pháp tốt nhất có sẵn (BAT) trong các nghiên cứu Controlled Myelofibrosis Study với điều trị bằng thuốc uống ức chế JAK (COMFORT). COMFORT-II là một nghiên cứu pha 3 ngẫu nhiên (2:1), mở tại những bệnh nhân bị xơ tủy; những bệnh nhân được phân ngẫu nhiên vào nhóm BAT có thể chuyển sang ruxolitinib khi bệnh tiến triển theo định nghĩa của giao thức hoặc sau kết thúc điểm chính, làm phức tạp so sánh dài hạn. Vào tuần thứ 48, 28% (41/146) bệnh nhân được phân ngẫu nhiên vào ruxolitinib đạt được giảm ⩾35% khối lượng lách (điểm chính) so với không có bệnh nhân nào ở BAT (P<0.001). Trong số 78 bệnh nhân (53.4%) trong nhánh ruxolitinib đạt được giảm ⩾35% khối lượng lách bất kỳ lúc nào, xác suất duy trì đáp ứng là 0.48 (khoảng tin cậy (CI), 0.35–0.60) sau 5 năm (trung vị, 3.2 năm). Trung vị thời gian sống toàn bộ chưa được đạt ở nhánh ruxolitinib và là 4.1 năm ở nhánh BAT. Có giảm 33% nguy cơ tử vong với ruxolitinib so với BAT theo phân tích ý định điều trị (tỷ lệ nguy cơ (HR) = 0.67; CI 95%, 0.44–1.02; P = 0.06); HR điều chỉnh chéo là 0.44 (CI 95%, 0.18–1.04; P = 0.06). Không có sự gia tăng không mong đợi về tỷ lệ mắc phải tác dụng phụ với thời gian dùng lâu hơn. Phân tích cuối cùng này cho thấy rằng các giảm khối lượng lách với ruxolitinib được duy trì với liệu pháp tiếp tục và có thể liên quan đến lợi ích sống còn.

#ruxolitinib #Janus kinase ức chế #xơ tủy #COMFORT-II #khối lượng lách #tỷ lệ sống còn #phân tích giai đoạn 3 #nguy cơ tử vong #tác dụng phụ
Dữ liệu chuẩn về dân số chung EORTC QLQ-C30 cho Ý theo giới tính, độ tuổi và tình trạng sức khỏe: phân tích 1.036 cá nhân
BMC Public Health - - 2022
Tóm tắt Bối cảnh

Các giá trị chuẩn về chất lượng cuộc sống liên quan đến sức khỏe (HRQoL) từ Bảng câu hỏi chất lượng cuộc sống của Tổ chức Nghiên cứu và Điều trị Ung thư Châu Âu – Core 30 (EORTC QLQ-C30) hiện đã có cho nhiều quốc gia, phần lớn từ Bắc Âu. Tuy nhiên, các giá trị chuẩn này chưa có sẵn cho Nam Âu. Do đó, nghiên cứu này nhằm cung cấp các giá trị chuẩn cho dân số chung Ý theo giới tính, độ tuổi và tình trạng sức khỏe dựa vào EORTC QLQ-C30.

Vật liệu và phương pháp

Nghiên cứu sử dụng dữ liệu EORTC QLQ-C30 từ dân số chung Ý được thu thập trước đó trong một dự án quốc tế của EORTC với hơn 15.000 người trả lời từ 15 quốc gia. Việc tuyển dụng và đánh giá được thực hiện qua các bảng trực tuyến. Lấy mẫu ngẫu nhiên áp dụng cho các nhóm giới tính và độ tuổi (18‍–‍39, 40–49, 50–59, 60–69 và ≥ 70 tuổi), riêng biệt cho từng quốc gia.

Chúng tôi đã áp dụng các trọng số để khớp với phân bố tuổi và giới tính trong mẫu của chúng tôi dựa trên thống kê của Liên Hợp Quốc về Ý. Ngoài các thống kê mô tả, còn áp dụng mô hình hồi quy tuyến tính để mô tả sự liên kết giữa giới tính, tuổi và tình trạng sức khỏe với các điểm EORTC QLQ-C30.

Kết quả

Có tổng cộng 1.036 người trả lời từ Ý được đưa vào phân tích. Tuổi trung bình có cân nặng là 49,3 tuổi, với 536 (51,7%) người tham gia là nữ. Có ít nhất một tình trạng sức khỏe được báo cáo bởi 60,7% người tham gia. Nam giới báo cáo điểm số tốt hơn so với nữ giới trên tất cả các thang đo EORTC QLQ-C30 ngoại trừ tiêu chảy. Trong khi tác động của tuổi khác nhau trên các thang đo, giá trị tuổi lớn hơn nhìn chung được liên kết với chất lượng cuộc sống cao hơn như được chỉ ra bằng điểm số tổng hợp. Đối với tất cả các thang đo, các khác biệt đều nghiêng về phía trước của những người không báo cáo bất kỳ tình trạng sức khỏe nào, so với những người báo cáo ít nhất một tình trạng.

Kết luận

Các giá trị chuẩn của Ý cho các thang đo EORTC QLQ-C30 ủng hộ việc diễn giải hồ sơ chất lượng cuộc sống liên quan đến sức khỏe trong các bệnh nhân ung thư tại Ý. Tác động mạnh mẽ của các tình trạng sức khỏe lên các điểm số EORTC QLQ-C30 nhấn mạnh tầm quan trọng của việc điều chỉnh tác động của các bệnh đồng mắc ở bệnh nhân ung thư khi diễn giải dữ liệu HRQoL.

#EORTC QLQ-C30 #Chất lượng Cuộc sống Liên quan đến Sức khỏe #Giá trị Chuẩn Ý #Tình trạng Sức khỏe #Giới tính #Độ tuổi #Ung thư người Ý #Dữ liệu Norm
Dấu hiệu ngôn ngữ biểu hiện chiến lược lịch sự trong phát biểu chính trị Anh và Mỹ: hướng tiếp cận khối liệu
Bài viết tìm hiểu việc sử dụng các dấu hiệu ngôn ngữ biểu hiện chiến lược lịch sự trong diễn ngôn chính trị Anh và Mỹ bằng phương pháp phân tích khối liệu. Các dấu hiệu biểu hiện chiến lược lịch sự dương tính và âm tính trong phát biểu chính trị Anh và Mỹ được thu thập để phân tích so sánh. Kết quả nghiên cứu cho thấy các dấu hiệu lịch sự trong các phát biểu chính trị này được thể hiện qua các cấu trúc ngôn ngữ chứa đựng các động từ, tính từ và trạng từ tình thái. Các dấu hiệu ngôn ngữ biểu hiện chiến lược lịch sự dương tính xuất hiện nhiều trong khối liệu diễn ngôn chính trị Mỹ hơn, trong khi đó các dấu hiệu ngôn ngữ biểu hiện chiến lược lịch sự âm tính được sử dụng với tần suất cao hơn trong khối liệu diễn ngôn chính trị Anh. Như vậy, có thể nhận định rằng các chính trị gia Mỹ có xu hướng sử dụng chiến lược lịch sự dương tính, ngược lại các chính trị gia Anh thiên về chiến lược lịch sự âm tính.
#lịch sự #tình thái #khối liệu #dương tính #âm tính
TỔNG HỢP, ĐẶC TRƯNG VÀ ỨNG DỤNG VẬT LIỆU NANO-ZEOLIT NaX TỪ CAO LANH II - TỔNG HỢP VÀ ĐẶC TRƯNG VẬT LIỆU NANO-ZEOLIT NaX TỪ CAO LANH KHÔNG XỬ LÝ AXIT- ẢNH HƯỞNG CỦA PHƯƠNG PHÁP XỬ LÝ NGUYÊN LIỆU VÀ HÀM LƯỢNG NƯỚC TRONG GEL ĐẾN KÍCH THƯỚC TINH THỂ
Vietnam Journal of Chemistry - Tập 49 Số 2 - 2012
Nano-zeolite NaX has been synthesized from Phu Tho kaolin without acid treating step. Influence of raw materials treating method and water content in gel on crystal size have been investigated. Results obtained from XRD, IR, SEM, TEM, TG/DSC show that nano-zeolite NaX has crystallinity of 95%, specific surface area of 573m2/g (with outer surface area of 92 m2/g), crystal size of 25nm, thermal stability up to 798oC. Without acid treating step, the surface area is higher but pore size in mesoporous range and crystal size is larger. Increasing water content in gel makes crystal size increasing sharply.
Ngữ liệu dạy học trong sách giáo khoa môn Tự nhiên và Xã hội và tài liệu Macmillan Natural and Social Science 1, 2, 3
Bài báo tìm hiểu ngữ liệu trong sách giáo khoa Tự nhiên và Xã hội (TN&XH) 1, 2, 3 và tài liệu Macmillan Natural and Social Science book (MS) 1, 2, 3 để thấy được sự khác biệt giữa hai tài liệu này về mặt ngữ liệu, ý nghĩa và vai trò của ngữ liệu trong việc dạy học Tự nhiên & Xã hội; qua đó, nêu lên một số lưu ý trong việc xây dựng, biên soạn và sử dụng ngữ liệu dạy học TN&XH ở tiểu học. Normal 0 false false false EN-US X-NONE X-NONE /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Times New Roman","serif";}
#Sách giáo khoa Tự nhiên và Xã hội #tài liệu Macmillan Natural and Social Science #ngữ liệu
Khoanh vùng nguy cơ ngập lụt do ảnh hưởng mưa kéo dài ở thủ đô Hà Nội bằng tư liệu viễn thám và GIS
Flooding is always a severe thread to urban areas, causing extensive damage to houses, buildings, public infrastructure and human life. In recent years, due to the effects of El Nino and La Nina, more and more ocean storms and heavy rain have been occurring. Besides, in the process of urbanization, the growing use of concrete to build urban infrastructure has decreased the natural surface infiltration. Consequently, when heavy rain happens, flooding occurs more frequently because of the overloaded drainage systems. Recently, Ha Noi has suffered heavy flooding after prolonged rain. The purpose of this article is to analyze flood situation due to heavy rain in Ha Noi (in 2008 and 2013) in order to localize the risk of flooding in Ha Noi by using remote sensing and GIS data. The content of the methodology is to use satellite images to identify and extract flooded areas because of the prolonged periods of heavy rainfall and then use some analytical methods to implement the subject’s target.
NGHIÊN CỨU CHIẾT TÁCH DẦU TỪ SINH KHỐI VI TẢO HỌ BOTRYOCOCCUS SP LÀM NGUYÊN LIỆU CHO QUÁ TRÌNH TỔNG HỢP BIODIESEL
This study examines the effects of various solvents, temperature, and reaction time on oil extraction yield from microalgae Botryococcus sp biomass. Different solvents were used separately or in combination such as n-hexane, n-heptane, toluene, ethanol, iso-propanol, mixture of n-hexane/etanol and the mixture of n-heptane/iso-propanol. The results showed that with different conditions, the extraction yield was varied and the highest yield (37.36%) can be achived by using the solvent mixture of n-hexane/ethanol 2:1 (v/v) at temperature of 60ºC for 10h.
Tổng số: 38   
  • 1
  • 2
  • 3
  • 4